Atendendo às necessidades de Tempo Real e análises profundas com uma arquitetura Lambda. Utilizando de ferramentas de ingestão e análise, ElasticSearch e Kibana e Ecossistema do Hadoop.
Hugo Rozestraten Solutions Architect, Amazon Web Services
Hugo Rozestraten é Arquiteto de Soluções de Big Data e Banco de Dados na AWS América Latina. Tem 18 anos de atuação na área de Tecnologia da Informação, tendo iniciado com desenvolvimento, e por mais de uma década como DBA/ATG Oracle. Atuou na IBM, Oracle, e atualmente na Amazon Web Services (AWS) ajudando clientes no desenho de soluções e migrações para a nuvem. Se formou em Engenharia Agronômica em 1994 pela ESALQ-USP e MBA em 2001 pela FEA-USP.
Feature Engineering é o processo de extrair e selecionar, a partir de dados brutos, características que possam ser utilizadas de forma efetiva em modelos preditivos. Como a qualidade das features influencia muito a qualidade dos resultados, conhecer as principais técnicas e armadilhas lhe ajudarão a ter sucesso na utilização de machine learning em seus projetos. Nesta palestra, serão apresentados métodos e técnicas que permitem extrair o potencial máximo das features de um dataset, aumentando flexibilidade, simplicidade e acurácia dos modelos. Serão apresentados exemplos em Python para os frameworks Pandas, Scikit-learn, Spark SQL e Tensorflow.
Gabriel Moreira Data Scientist, Ci&T
Gabriel é Lead Data Scientist CI&T. Possui bacharelado em Ciência da Computação e Mestrado pelo ITA, onde atualmente cursa Doutorado, com ênfase em Sistemas de Recomendação e Deep Learning. Possui mais de 15 anos de experiência em desenvolvimento de software, soluções de machine learning, data mining e big data.
Quando seus negócios crescem, seus sistemas chave não suportam mais o volume de informação inserido, não respondem mais requisições dos seus clientes, a quem chamar? Como resolver? Conheça o Apache Cassandra e como foi fundamental para evoluir nossos sistemas e alavancar o crescimento dos nossos negócios, aplicado no desenvolvimento de sistemas distribuídos de alto desempenho para aplicativos móveis
Eiti Kimura Coordenador de TI, Movile
Eiti tem mais de 15 anos de experiência com desenvolvimento de software, além de mestrado em eng. elétrica com especialização em engenharia de software. Possui a certificação Apache Cassandra 2014-2015 e trabalha com o Cassandra desde a versão 0.6. Tem ampla experiência no desenvolvimento de sistemas de back-end para serviços de cobrança de operadoras de telefonia, envio de mensagens SMS em massa Hoje trabalha como Coordenador de TI e arquiteto de sistemas distribuídos de alta performance na Movile Brasil.
Como utilizar o tradicional banco de dados SQL Server no Linux para obter uma Alta Disponibilidade em seu ambiente.
Erickson Ricci CEO & Founder, SQL Core
Profissional com mais de 10 anos de experiência na área de banco de dados tendo atuado em grandes empresas como IBM, Microsoft, Banco Itaú, Aurea (US), entre outras. Além de certificações Microsoft em SQL Server, realizou o Empretec do Sebrae em 2016 e está cursando Gestão Empresarial na FGV. É fundador da SQLCORE, consultoria especializada em SQL Server, prestando consultoria de tuning, alta disponibilidade e administração de bancos de dados.
O mundo do desenvolvimento de software evoluiu, mas as práticas de administração e desenvolvimento em bancos de dados parecem ter parado na idade das trevas. Como fazer para que o DBA se integre ao Desenvolvimento Ágil de software e ao mundo DevOps, tornando seus processos e ferramentas mais iterativos e evolutivos?
Gostaria de saber como processar grandes volumes de dados em tempo real para criar novas experiências e soluções para jogos, aplicativos ou para o emergente universo de sensores IoT? Então venha participar dessa sessão onde iremos realizar um deep dive nas arquiteturas e tecnologias do Google Cloud que podem simplificar bastante nossa vida na hora de lidar com esse desafio. Através da apresentação de conceitos, código e demos, os participantes poderão conhecer com mais detalhes as tecnologias de Big Data do GCP, como: Cloud Dataflow Pub/Sub BigQuery
Com o rápido desenvolvimento e evolução das aplicações, altos volumes de influxo de dados e usuários cada mais exigentes, verificou-se a necessidade de desenvolvimento de sistemas inteligentes capazes de auxiliar na análise de dados e de auxiliar em tomadas de decisão. Nos últimos anos tem-se falado muito sobre Machine Learning e sobre as mais diversas aplicações nos negócios, que passam desde linguagem de processamento natural até mesmo em reconhecimento facial e outras aplicações. O objetivo da talk é compartilhar um pouco sobre a experiência do nosso time de Core Machine Learning na Movile sobre como utilizamos ferramentas simples, open source, e algoritmos 'on the shelf' para implementar na nossa plataforma um sistema de monitoramento de machine learning que já ajudou a evitar perdas na ordem de 3 milhões de dólares. Também mostraremos as evoluções que fizemos nas plataformas: a migração para usar os recursos do Spark 2.0 e a mudança para uma arquitetura baseada em microserviços.
Flávio Clésio Core Machine Learning , Movile
Flávio Clésio é especialista em Machine Learning e garantia de receita pela Movile, onde desenvolve aplicações inteligentes para exploração de oportunidades de aumento de receita, além de automação da tomada de decisão. Antes da Movile, trabalhou com Business Intelligence no mercado financeiro, especialmente no mercado de créditos não performados (Non-Performing Loans). Possuí mestrado em inteligência computacional aplicada no mercado financeiro.
Com o rápido desenvolvimento e evolução das aplicações, altos volumes de influxo de dados e usuários cada mais exigentes, verificou-se a necessidade de desenvolvimento de sistemas inteligentes capazes de auxiliar na análise de dados e de auxiliar em tomadas de decisão. Nos últimos anos tem-se falado muito sobre Machine Learning e sobre as mais diversas aplicações nos negócios, que passam desde linguagem de processamento natural até mesmo em reconhecimento facial e outras aplicações. O objetivo da talk é compartilhar um pouco sobre a experiência do nosso time de Core Machine Learning na Movile sobre como utilizamos ferramentas simples, open source, e algoritmos 'on the shelf' para implementar na nossa plataforma um sistema de monitoramento de machine learning que já ajudou a evitar perdas na ordem de 3 milhões de dólares. Também mostraremos as evoluções que fizemos nas plataformas: a migração para usar os recursos do Spark 2.0 e a mudança para uma arquitetura baseada em microserviços.
Luciano Sabença Software Engineer, Movile
Luciano é Software Engineer na Movile há mais de 5 anos, atuando com na arquitetura e desenvolvimento de sistemas distribuídos e Machine Learning. Possuí interesse pelas áreas de Machine Learning, Teoria da Computação e sistemas distribuídos. É técnico em informática pelo Colégio Técnico de Campinas e bacharel, com distinção, em Ciência da Computação pelo IC/Unicamp.
Através de uma abordagem prática com exemplos reais, serão comentados os pontos fortes e fracos dos serviços Google BigQuery, Amazon EMR com Presto e Amazon Athena. O objetivo é compartilhar com o espectador a experiência com esses serviços, mostrando como eles podem viabilizar análises com o melhor custo-benefício para ambientes de todos os tamanhos.
Arquiteturas com micro-serviços está cada vez sendo mais usada, mas a parte de gerenciamento de dados entre os micro-serviços ainda é um tema complexo. Outra dificuldade é como fazer a movimentação de uma arquitetura monolítica para micro-seviços. Nesta palestra vou apresentar a experiência do iFood, e como a divisão em micro-serviços tem nos ajudado a escalar o ambiente desse negócio que já está fazendo mais de 4 milhões de pedidos por mês, e vem crescendo quase exponencialmente. Vamos falar um pouco dos desafios e problemas que enfrentamos, como fazer _deploy_ sem _downtime_ (mesmo com bancos de dados relacionais), como gerenciar troca e duplicidade de dados entre serviços e também um pouco sobre persistência poliglota.
Matheus Oliveira DBA, iFood
Formado em Ciências de Computação pela USP, é apaixonado por tecnologia e especificamente trabalhar com dados. Hoje é o líder técnico da equipe de banco de dados no iFood, onde ajuda a empresa a suportar a demanda comum de uma Black Friday em comércios online, só que todo final de semana; suportando toda camada de armazenamento de dados de vários micro-serviços que suportam a operação do iFood. Possui domínio de várias tecnologias de banco de dados, mas tendo maior domínio e atuação com o PostgreSQL, que já trabalha há vários anos, com suporte, treinamento, e até mesmo contribuição ao código fonte do projeto.
Monitorar os recursos e processos físicos do servidor com o Power BI. Através da configuração de alguns contadores do perfmon e da rotina de Relog, será criado um dashboard no Power BI para acompanhar por exemplo: desempenho da CPU, quantidade de memória e vários outros recursos específicos do SQL Server.
Sulamita Dantas Analista BI, AlmaViva do Brasil
Formada em Ciência da Computação. Possui experiência como DBA SQL Server, Analista Protheus e atualmente trabalha com BI. Participa da comunidade Técnica SQL Server. Palestrante e voluntária em vários eventos. Conselheira Fiscal da ONG MTAC Co-Líder Local Group SQL BH
Oracle e SQL Server figuram como líderes absolutos no quadrante mágico do Gartner para sistemas gerenciadores de banco de dados (SGDB). Mas qual delas realmente é a melhor? O objetivo dessa palestra é mostrar as diferenças técnicas e comerciais das duas plataformas de dados mais utilizadas no mundo. Quem vence essa batalha?
Thiago Caserta Diretor de Produtos e Soluções, Ativy
Thiago Caserta é Diretor de Produtos e Soluções da Ativy, empresa brasileira com foco em Cloud Computing e IT Outsourcing. Formado em Análise de Sistemas com especialização em Management and Leadership pela FGV e Cloud Computing pela University of Illinois, IL, USA. Possui diversas certificações focadas em SQL Server. Caserta passou por empresas como T-Systems e IBM atuando como especialista em banco de dados e entre 2011 e 2016 trabalhou na Microsoft Corporation nos Estados Unidos, atuando com clientes da plataforma de dados SQL Server na adoção das soluções em nuvem da Microsoft (Azure e SQL Azure), como JP Morgan, UPS, Intel e Cisco.
Oracle e SQL Server figuram como líderes absolutos no quadrante mágico do Gartner para sistemas gerenciadores de banco de dados (SGDB). Mas qual delas realmente é a melhor? O objetivo dessa palestra é mostrar as diferenças técnicas e comerciais das duas plataformas de dados mais utilizadas no mundo. Quem vence essa batalha?
Marcelo Cauduro Diretor de Tecnologia, Ativy | High Performance Cloud
Marcelo Cauduro é CTO da Ativy, empresa brasileira com foco em Cloud Computing e IT Outsourcing. Com experiência de mais de 15 anos no mercado de Tecnologia da Informação, Marcelo teve passagens por grandes empresas tais como Motorola, MATERA Systems, IBM e Inmetrics. Nos ultimos anos atuou a frente do time de banco de dados da Redecard Itaú e atualmente é responsável por todo parque tecnológico da Ativy e está a frente da inovação dos produtos e serviços. Marcelo é formado em Análise de Sistemas pela PUC Campinas.
Jornada e Aplicação de Analytics em bancos
Eduardo Hruschka Superintendente de Ciência de Dados, Itaú-Unibanco
Eduardo Hruschka é superintendente de ciência de dados do Itaú-Unibanco. Entre 2013-2016, foi cientista-chefe da startup “Big Data”. Concluiu seu doutorado em 2001 no Programa Interdisciplinar de Computação de Alto Desempenho da COPPE/UFRJ. Realizou pós-doutoramento em ciência de dados na University of Texas at Austin, entre 2010-2012. Obteve seu título de Livre-Docente em Ciências de Computação pela USP em 2012. É professor do Departamento de Ciências da Computação do ICMC/USP, atualmente contribuindo apenas com a pós graduação. Foi Jovem Pesquisador da FAPESP e é pesquisador nível 1-D do CNPq. Foi editor associado do periódico científico Information Sciences, da editora Elsevier. Tem atuado na área de ciência de dados, com particular ênfase em desenvolver, aperfeiçoar e aplicar algoritmos para aprendizado de máquina, desde 1996. Publicou mais de 100 artigos científicos, os quais receberam mais de 2.700 citações.